A case report on gendered biases in a Finnish healthcare AI assistant
この論文は、フィンランドの医療向け AI アシスタントにおいて、性別によるバイアスが検索・生成の両段階で顕著に現れ、特に女性向けクエリに対して医療的妥当性のない育児や生殖健康に関するステレオタイプな回答が生成されることを実証している。
193 件の論文
この論文は、フィンランドの医療向け AI アシスタントにおいて、性別によるバイアスが検索・生成の両段階で顕著に現れ、特に女性向けクエリに対して医療的妥当性のない育児や生殖健康に関するステレオタイプな回答が生成されることを実証している。
この論文は、画像反応、循環腫瘍 DNA、安全性、生存率を統合した合成オンコロジー臨床試験フレームワークを開発し、生物学的に妥当かつ解析的に一貫した有効性 - 安全性シグナルを再現することで、意思決定指向の転移医療データ科学の原型を示したものである。
本研究は、30 日後の退院後死亡率予測において、胸部 X 線画像を専門医による所見報告書に置き換えることが、単なる識別能力の低下ではなく、患者のリスク順位付けそのものを変化させることを示し、生データと要約テキストの間の情報格差を評価する重要性を明らかにした。
本論文は、胸郭 X 線画像の医療 AI 研究において、高所得国が主導権を握り、低所得国からのデータや著者が著しく不足している不均衡な現状を科学的に分析し、これが医療格差の拡大や AI 性能の偏りを招くリスクを指摘しています。
この研究は、行動健康危機ユニットにおける患者や介護者の安全認識と AI によるリスク評価を比較し、環境の安全性が施設選択に重要な影響を与えること、また AI と人間の認識には材料の質感や未分類のリスクなどにおいて相違があるものの、AI 支援ツールの統合がより安全な環境の意思決定に有用であることを示しています。
この大規模国際横断調査は、医学誌の査読者が人工知能チャットボットに高い親和性を持つ一方で、倫理的懸念やトレーニング不足を理由に査読プロセスでの利用は限定的であり、広範な導入にはガイドラインの整備が不可欠であることを示しています。
この論文は、電子健康記録と請求データをリンクさせた高スループットな観察研究ワークフローを開発し、標準化された測定アーキテクチャを用いて多数の臨床領域で包括的なエビデンスを生成することで、断片的な研究から精密医療を支える統合的なエビデンス基盤への転換を可能にしたことを示しています。
この論文は、不均衡データと欠損値に強いベイズアンサンブルモデルと不確実性に基づくトリエージ手法を開発し、検証コホートで完全な識別性能、臨床監査で 69.2% の感度および 100% の精度を達成し、偽陽性ゼロの周術期死亡率予測システムの実現を示したものである。
本論文は、大規模な事前学習を不要とし、医療コードの時間的パターンと人口統計変数を効率的に統合する軽量エンドツーエンドモデル「TELF」を提案し、複数の疾患リスク予測タスクにおいて既存の機械学習手法を上回る性能と解釈可能性を証明したものである。
この論文は、7,081 人の成人の音声データを用いて開発された「音声年齢」推定モデルが、既存の老化時計と同等の精度を持ちながら、肥満や睡眠障害、心代謝リスクなど独立した生物学的老化の指標となり得ることを示しています。
本論文は、大規模言語モデルをモデル非依存の推論エンジンとして活用しつつ、臨床的整合性を保つ厳密なスキーマ設計を中核とする「Digital Registrar」フレームワークを開発し、多癌種の病理報告書からレジストリ基準を満たすプライバシー保護型の構造化データを高精度に抽出する手法を提案したものである。
本論文は、CD276 が髄膜腫のグレードと関連する遺伝子であるものの、単独の強力な予測因子や安定した分類器特徴量としては機能せず、その予測性能はより広範な多遺伝子トランスクリプトーム構造に依存し、CD276 は広範なトランスクリプトームプログラムの中で解釈すべき生物学的情報源として位置づけられることを示しています。
本論文は、臨床文書からの移動機能状態抽出タスクにおいて、異なる種類の 3 つの大規模言語モデルの再現性とロバスト性を評価し、温度設定やプロンプトの言い換えが安定性に与える影響を明らかにするとともに、多数決による自己一貫性手法が安定性を大幅に向上させることを示しています。
この論文は、機械学習モデルを用いて電子カルテデータから心不全患者の Kansas City 心筋症質問票(KCCQ)スコアを高精度に推定する手法を開発・検証し、患者報告アウトカムが不完全に収集されている集団における心血管アウトカムの評価やリスク層別化を支援できることを示したものである。
本研究は、構造化されていない臨床記録から社会決定要因(SDoH)を抽出する手法として、従来のルールベースシステムよりも高性能な大規模言語モデル(LLM)を評価し、両者を組み合わせることでドメインレベルの抽出精度をさらに向上させることを示しました。
本論文は、50 万件の非識別臨床ノートを用いた教師あり継続事前学習により、Qwen3-4B モデルを医療知識で強化し、診断予測や心停止検出などの臨床タスクで既存の大型モデルを上回る性能を発揮しつつ、一般分野の能力を維持したことを示しています。
本論文は、医療分野における大規模言語モデルの信頼性を向上させるため、外部仲裁者を不要とし、自律的なマルチエージェントの反復的合意プロセスを通じて事実性の高い回答を導き出す新しいフレームワーク「Med-ICE」を提案し、既存手法を上回る性能と高い拡張性を示したものである。
本論文は、医療 AI 研究システムの評価において引用の正確性が決定的な要因であることを示し、NHANES データに基づくベンチマーク「MedResearchBench」を用いた実証研究を通じて、従来の単一モデル評価の限界を指摘するとともに、マルチエージェントによる引用検証・修復パイプラインの導入が信頼性の高い学術生成を実現することを明らかにしています。
がん患者のピアサポートテキストにおける心理社会的負担の分析において、補助タスクの追加は主要タスクの性能を低下させ、LLM 由来のソフトラベルよりも人間によるハードラベルの方が感情分類の精度が高かったため、複合負担のみのマルチタスク学習とハードラベル教師あり学習が最も効果的であると結論付けられました。
本論文は、母音の音響特徴量と機械学習モデルを用いて自閉症スペクトラム障害の成人を健常者と区別する手法を開発・評価し、特に基本周波数が最も重要な予測因子であることを示すことで、言語に基づく透明性のある自閉症スクリーニング支援の可能性を実証したものである。